Intégrer le traitement d'étiquetage avec treetagger et udpipe sur les contenus des balises TITRE et DESCRIPTION de tous les fichiers de l'« arborescence de fils » à partir du programme bao1.
Construire en sortie un fichier structuré regroupant l’ensemble des traitements d’étiquetage.
Ainsi, nous avons pu étiqueter les données textuelles et transformer le résultat d'udpipe en xml.
Méthode | TXT | XML |
---|---|---|
Udpipe | Cliquez ce lien | Cliquez ce lien |
Treetagger | Cliquez ce lien | Cliquez ce lien |